SOUND EVENT DETECTION ENHANCED BY SCENE INFORMATION FOR DCASE CHALLENGE 2024 TASK4
使用モデルはおそらくほぼベースライン通り
構造と学習手法や方針に工夫がある
CNNでシーンの推測をさせる
シーン情報を使ってイベント検出精度を上げるらしい
? 不確かな情報を使って精度は上がるのだろうか?
気になったら読もう